Cell报道通过CRISPR全基因组扫描的生信分析发现癌症关键基因
癌症是一种异质性很高的疾病。不同的癌症或者癌症亚型,可能有各种不同的生存相关通路,使得其对抗癌药物具有不
36 24922 36 9017 0 0 3987 0 0:00:06 0:00:02 0:00:04 3986的反应。找到这些通路上与癌症细胞生存和增殖相关的关键基因,将有助于开发新的抗癌药物。在2017年2月23日,美国学者David M. Sabatini和Eric S. Lander领衔的研究团队在《Cell》上发表一篇题为“Gene Essentiality Profiling Reveals Gene Networks and Synthetic Lethal Interactions with Oncogenic Ras”,为此迈出了重要的一步。他们利用CRISPR技术,从14种人类急性髓性白血病(AML)细胞系中筛选出和癌症细胞生存与增殖相关的关键基因,基于这份“关键基因图谱”,揭示关键基因的互作网络,以及与Ras基因互作的合成致死基因(Partner)。
首先,研究人员构建带有Cas9蛋白的sgRNA慢病毒载体文库,包含了作用于人类18,543个编码基因和1,504基因间区及非特异性区域的sgRNA,每个基因或区域约有8-10个sgRNAs覆盖。然后,将慢病毒文库和细胞混合,以低感染复数(multiplicity of infection, MOI)感染细胞,使得每个细胞中只包含一种sgRNA。培养72h后,用嘌呤霉素筛选一次。收集约80 million细胞进行DNA提取(initial 样本),剩余细胞每三天传代一次,经过14次群体倍数(population doublings)扩增后,收集约100 million个细胞进行DNA提取(final 样本)。PCR扩增initial和final DNA sample中的sgRNAs,用HisSeq2500进行测序,比较二者sgRNA丰度的变化情况,得到CRISPR gene score(见图1)。如果某个基因与癌细胞生长增殖有关,则该基因在被敲除后,细胞增殖生长将受到抑制甚至死亡,那么对应的sgRNA丰度将会降低。所以,某个基因对应低CS,往往是癌细胞增殖的关键基因(CS < -1)。
图1 CRISPR筛选流程
基于上述所得的CS值,通过与前人研究结果作比较,以及自身技术重复,表明研究结果的可重复性和可靠性。由于Cas9介导的DNA片段剪切,往往因为某些DNA区域剪切片段过大引起DNA损伤反应(如存在串联重复序列),导致细胞死亡。因此,在数据分析之前,需要先将这些非关键基因排除。该研究团队采用sliding window score (SWS) 法寻找这些非关键基因。步骤如下:1、计算所有细胞系的基因平均CS值,从大到小排序,移除下15%的基因;2、在一个细胞系中,将剩余基因的CS值从大到小排序,计算这些基因上、下游各20个基因中有多少是位于下3%的,记为SWS值。SWS > 12为高SWS基因,不用于后续的必需基因间的correlated gene essentiality分析。在SWS分析后,发现高SWS区域,的确存在很高的DNA拷贝数,证明该方法的有效性,以及结果的可靠性。移除这些区域内的基因,一方面将减少下游分析的混杂因素;但也存在误删的可能。
由于位于相同细胞通路上的关键基因,往往具有相似的gene essentiality pattern(图2)。所以,在通过SWS法移除非必需基因后,研究人员进行了correlated gene essentiality分析,发现了许多具有相似pattern的基因。其中,一些相关基因在前人报道中,已经发现他们位于同一个生物学过程或者通路上;一些基因则尚未被报道。研究人员从中挑选了C1orf27和C17orf89两个基因进行功能验证,发现这两个基因的确是位于correlated gene essentiality分析所得的通路上。
图2 Correlated gene essentiality分析
此外,该“关键基因图谱”还可用于寻找与致癌基因互作的合成致死基因。由于Ras基因是急性髓性白血病等癌症中经常发生突变的癌基因,临床预后较差。Ras基因参与许多基本的细胞生物过程,在大多数情况下,Ras基因突变都被认为是“无药可治”的。但是,可以通过寻找与之互作的同样是癌症增殖所依赖的基因。不幸的是,这些基因目前仍难以确定,而CRISPR技术为此提供了可能。
挑选上述12种细胞因子依赖的细胞系,其中6种带有Ras基因突变,6种不带有Ras基因突变。比较这两组细胞系中关键基因的差异,发现了5个基因是与Ras基因互作的合成致死基因(RCE1,ICM1,RAF1,SHOC2和PREX1)。基于所得到的这5个基因及其特点,研究人员一一做了功能上的验证,并对PREX1进行重点后续的功能研究(图3),因为该基因仅在Ras依赖的AML细胞系中为必需基因,而在非AML细胞系中,是非必需基因。
图3 Rac synthetic lethality
综上,这篇Cell的文章首先利用慢病毒载体表达sgRNA文库,对细胞系中的基因一一敲除,比较敲除前后sgRNA丰度的变化,利用CS值进行一系列生物信息分析,主要包括关键基因的富集分析,Correlated gene essentiality分析,以及与致癌基因互作的合成致死性基因。通过生物信息分析得到的候选基因,进行一系列功能验证。这种基于生物信息学分析结果,结合功能验证的实验设计,相对于单纯的生物信息分析更为可靠和严谨,也是将来生物信息研究的趋势。
参考文献:
Tim Wang, Haiyan Yu, icholas W. Hughes, ..., Walter W. Chen, ric S. Lander, David M. Sabatini Gene Essentiality Profiling Reveals Gene Networks and Synthetic Lethal Interactions with Oncogenic Ras. 2017, Cell 168, 890–903.